隠れマルコフモデル(カルマンフィルタ)の勉強配信アーカイブとメモ(NMA Hidden Dynamics)
https://www.youtube.com/watch?v=5Cmg1XyHiqs
Naa_tsure.icon正直よくわからん話
本編:7:14-あたり
Transition Matrix:Dについて
$ s_{t-1}から$ s_{t}への変換で出てくる行列
離散の場合だと以下のような行列
$ D=\begin{pmatrix}p_{stay}&p_{switch} \\ p_{switch}&p_{stay} \end{pmatrix}
この行列は真の値latent stateの変化を表している????
真の値が確率的に変化するというのは上手く納得できない
Naa_tsure.icon全てのt-1→tの変化をこのDのみで表しているのなら妥当な表現では?
Naa_tsure.iconどうしても決定論的に見てしまうのは特定のt-1→tの変化だけに注目しているから(多分)
仮にこれを受け入れたとして、
何故t-1のposteriorからtのpriorに変換する際にも同じDを使うのか
このDの値はどこから降ってきたのか
このDも本来はエージェントにとって不明なパラメータなのでは????
だとしたらDも推定しなきゃ・・・とか考えているのだが全く分からんNaa_tsure.icon*3
hl.icon
ここではシンプルに近似してるだけなのではNaa_tsure.icon*2
違った。よく見たら$ p(s_{t-1})から$ p(s_{t})への変化だから、Dは真の状態ではなく観測者側の問題では?
もし観測をしなければ、Dに従って観測者の中で$ p(s_{t}=-1)=p(s_{t}=1)=0.5に近づく
って話が、本編:47:50あたりのチュートリアルで解説されている
でも、連続値では$ s_t=Ds_{t-1}+W_{t-1}として真の値をモデル化している(本編:2:13:55)
うーんわからん?Naa_tsure.icon*2
多分だけど、latent state Dynamicsのモデル化にDを使ってて、
計算する際にそれが観測者側のモデルに定数として入ってるだけな気がしている
hl.icon
本編:3:14:00あたり
codingのところで、likelihoodを平均mで分散をobserbed noiseにしていたけど、これp(m|s)になってる?
Naa_tsure.iconsの要素がどっから湧いたんだ・・・
hl.icon
追記Naa_tsure.icon:まず、そもそもlikelihood$ p(x|Θ)ってモデル(原因)からデータ(結果)が生じる確率なんだから、
現実の状態sから観測した値が生じる確率は$ p(m|s)でおかしくない
そして、多分このlikelihoodは観測者側の目線だから平均mで分散obserbed noiseでいいんだと思う
真のモデル?を考えると、平均はsで分散obserbed noiseになるけど、sは知りえないのでこうなる
In a Hidden Markov Model, we cannot directly observe the latent states $ s_t
Instead we get noisy measurements $ m_t∼$ p(m|s_t)
そしてその観察から真の状態を推測する$ p(s|m)